查看原文
其他

为什么微博总是充斥着负面情绪?

大学生科研竞赛 科研岛 2022-08-27


什么?微博数据可以做研究?

微博评论能够判断群体情绪?

人文社科也能用微博大数据发论文?


没错!


各位瓜友们还记得几年前沸沸扬扬的“鹿晗关晓彤”公开事件吗?场面之壮观可谓微博重要事件!


但是!同样是明星,同样公开恋情,为什么鹿晗评论清一色祝福,而关晓彤评论下面确实骂声一片?


鹿晗微博评论词云


关晓彤微博评论词云


其实词云已经是最简单的文本大数据情感分析工具啦!想要对这些评论做进一步的科研挖掘,你应该学会更多文本分析方法!人文社科再也不用拘泥于问卷、访谈、统计数据、计量模型啦!做有趣的研究,发更高质量的论文!


让小科康康是哪个社科er还不会文本分析法?(是小科本科了……)


“文本分析法”是人文社科类学术领域中的一种常用的研究方法,也逐渐被应用于多个跨学科的社会领域中,不过,其相对来说比较复杂,使用起来也有一定门槛。但社科er们想要写出高质量的科研论文,文本分析法就必不可少!那么在本期,大家就准备好小本本,来和小科一起了解一下何为“文本分析法”吧!


赶紧关注下方公众号回复【文本分析】按提示完成相关操作
即可免费领取【超全文本分析法学习资料包】!




基本概念




在具体了解文本分析法之前,我们首先需要对其中的关键词——“文本”(Text)进行基础性的认知。从狭义来看,“文本”指经由具像化的过程所呈现的内容物,此内容可以来自文件、图像、声音等等。从广义来看,前苏联文化符号学家尤里•洛特曼认为“文本”为“整体符号(intergral sign)”,即文化上有意义的符号组合,具有信息传递功能、信息生成功能和信息记忆功能。


围绕“文本”展开的分析方法,我们称之为“文本分析法”。从具体定义上来说,“文本分析法”是一种基于定性研究的量化分析方法,是基于社会科学目的,任何用于文本(或者其他符号材料)上的方法学上的度量,能对文本内容作系统、客观的定量和定性分析,从而揭示文本的变化与特征。




主要类型




从研究取向来看,文本分析法中比较有代表性的具体方法有以下三种:


1. 修辞分析法(“新批评”细读法)

“细读法”是新批评创造的一种具体的批评方法,它建立在对文本语义的细致分析的基础上,要求运用隐喻、含混、反讽、悖论等概念、理论和方法,对文本的语言和结构要素做尽可能详尽的分析和解释。修辞分析法的基本分析流程包括了解并分析词义、感受并理解语境、把握修辞特点。


从分析对象的层面来分析的话,修辞分析法所围绕的中心是文本的句法和语义单元、文本的意象和隐喻,以及对象征和象征系统的仔细阅读和分析。


2. “符号学”分析法

“符号学”是研究符号与符号运作的学问,主要研究领域包括符号本身、组成符号所依据的符号系统,以及符号运作所依存的文化。因此,“符号学”的分析视角要求我们首先尽可能多地列举文本中的有效符号,再分析符号的组合形式和组合手法,最后剖析其中的文化内涵及思想逻辑。


3. “叙述学”分析法

“叙述学”分析法又称“叙事学”分析法,主要围绕着“叙述内容”和“叙述方式”两大主题展开,其所阐述的内容全面深入,包括叙述行为、叙述者及分化、叙述层次、叙述时间、叙述体态、叙述语式。在此推荐两部关于“叙述学”分析法的具有代表性的学术著作:《叙事学》(胡亚敏);《中国现代经典短篇小说文本分析》(刘俐俐)。


4. 文本功能分析框架(纽马克)

英国实践型翻译理论家彼特•纽马克将文本类型划分为三类:表达型文本、信息型文本以及呼唤型文本。与此同时,他指出,对文本类型的划分并不是一成不变的,大多数文本具有两种及两种以上的功能,只是其中一种占据主导地位,并主张依据不同类型的文本,采取不同种类的分析方法。


从分析(编码)方式来看,文本分析法包括以下几种具体形式:


1. 人工编码(属于质性分析的范畴)

首先是对文本内容意义的解读。在横向层面上,注重分析不同文本之间的差异、联系及互动性影响;在纵向层面上,注重对文本的深层缘由(社会、历史等因素)、思想内涵和发展影响的深入探索。


其次是对形式意义的解读。主要侧重于对文本的呈现形式、所处位置(语境)、功能作用的分析解读。


2. 计算机辅助编码

指的是在人工分析过程中借助简单的电脑文书软件(如Word)进行图表制作及说明性文字阐述。


3. 计算机自动编码(属于定量分析的范畴)

包括对有效文本数据进行筛选、抽样统计以及编码归纳,并在此基础上对普遍的规律进行概括总结。常见的计算机文本分析软件有以下几种:

 ◆AnSWR 6.4

 ◆ATLAS.ti 5.2

 ◆EZ-Text

 ◆MAXqda 2

 ◆NUDIST 6


在文本分析法的范畴内,还有一些常见且实用的文本分析技术及软件:


1. 主题分析(Thematic analysis)

Nvivo,ATLAS. ti


2. 内容分析(Content analysis)

LIWC,DICTION


3. 基于词典的方法(Dictionary analysis)


4. 词袋法(文本向量化)(Bag-of--words)

(1)监督算法,如SVM、 Bayes和 Regression

(2)无监督算法,如LDA话题模型


5. 自然语言处理(Natural Language Processing)




具体分析步骤




1. 选择研究主题


2. 搜集及分析资料


3. 归类(按照对象、主题、情境或综合标准)


4. 确定具有代表性的样本目标

(1)整体抽样。制作抽样框,将框中的每项文本数据按照顺序编号,并统一采取随机抽样、系统抽样等的整体抽样方法。


(2)多阶段分组抽样。首先将文本数据分为不同组别,从中随机取出一组进行完整分析,或再从中随机抽样。


5. 找出高频关键词,确定分析单位或类别

分析单位包括物理单位、句法单位、语义单位、语用单位等等,涵义特征层面如社会特征、心理特征和身体特征;颜色形象层面如眼睛的颜色、头发的颜色、衣着的颜色。


6. 制定测量图表


7. 对文本单元进行具体的描述、说明和分析

(1)图表法。利用python, gephi等软件运行关系图。

(2)文字阐述法。在文案编辑软件中对文本单元进行说明与阐释。


★注意事项

1. 应按照分析单位的特征,尽量用量化的方式记录研究对象在各个层面的信息数据。


2. 最好采用事先设计好的、易于标准化统计分析的评判记录表。


3. 相同分析维度的评判必须有两个以上的评判员分别作出记录(数字形式)。


4. 根据类别(或关键词)出现频数进行记录、判断和分析时还要重视基数的大小。




基本特点




1. 非介入性

整个研究过程围绕的是现成的文本信息,不存在研究者干扰研究对象的情况。


2. 相对主观性

受研究者自身价值观念、政治立场、认知体验和知识结构等主观因素影响较大。


3. 超时空性

文本分析的研究范围广,可以通过线上或线下的资料收集而跨时空进行研究。与此同时,研究的时长也是可持续的,对研究对象及研究结果无干扰。


4. 综合性

文本分析既包括主观因素较多的定性研究,也包括科学性强的、需要充足客观事实支撑的定量研究。


5. 低成本性

与其他研究方法相比,文本分析法对时间、精力和经费等资源的消耗相对较少,对研究条件的要求较低。


6. 可证实性

需要有学术经验或客观科学的证据的支撑,并应经过系统化的调查取样。


7. 归纳性

文本分析法不是研究者自己事先对假设的演绎与阐释,而是对现有文本材料的归纳分析,强调多维度地深入文本材料,自下而上地浓缩、建构出一套理论框架。




意义价值




1. 从文本中搜寻多元化意义

一方面,我们可以探寻单个文本自身存在的因素和意义,另一方面还可以发掘出多个文本之间的互补性影响与作用。与此同时,研究者经过观察与研究所给予文本的意义也应被考虑在内。


2. 使文本内容与现实社会得以更加紧密的联系

就文本自身而言,我们通过分析可以探求文本的社会性、历史性因素;就文本与社会的关系而言,我们可以将从文本中浓缩出的理论应用于社会实践中去,更好地实现其现实价值。


3. 更好地描述文本内容的结构与功能

文本内容的结构既包含句法、语义单位之间的表层联系与结构,还包括各级单位之间经过互动所形成的整体性语义与语用结构(体现作者的思想观点、创作意图、个性态度)。通过分析,我们都能搜寻到这些结构都在不同层面上的不同功能,并将其应用到其他现实问题和研究课题中。


4. 透彻了解文本产生的前因后果

我们既要了解影响文本产生的相关变量和关键词,又要借助一些具有强客观性和权威性的文本,将其作为评判参考的标准。




有待进一步思考的问题




1. 文本分析中质性研究与定量研究的比重应如何权衡?


2. 文本分析与话语分析、内容分析之间的联系与区别?


3. 文本分析的局限性怎样弥补?

(文本分析的局限性包括研究对象的规模小、代表性低、相对主观性强等等)


4. 文本分析中数据处理的细节应如何完善?

(词语规范化、筛选掉无效数据、修正非标准化的文本)



什么?看完这些干货只懂了理论不懂操作?别担心,小科可是有备而来!今天小科特意为大家准备了超全文本分析法学习资料包!
赶紧关注下方公众号回复【文本分析】按提示完成相关操作
即可免费领取【超全文本分析法学习资料包】!

   资料包里有什么? 


   资源示例  


   其他示例  

篇幅有限以上仅展示部分


赶紧关注下方公众号回复【文本分析】按提示完成相关操作
即可免费领取【超全文本分析法学习资料包】!


参考文献:

[1]NEUENDORF K A. The content analysis guidebook [M], London: SAGE Publications Asia -Pacific Pte. Ltd, 2016.

[2]Lotman,Yury. Analysis of the Poetic Text[M], Edited &translated by D.Barton Johnson. Ann Arbor(Mich): Ardis Publishers, 1976.

[3]Content Analysis: An Introduction to Its Methodology. Krippendorff, Klaus. Sage . 2004.

[4]伍多·库卡茨, 质性文本分析[M], 重庆:重庆大学出版社, 2017.


END

LESSON/课程推荐




TODAY/资料推荐
 综合资料包 科研论文白皮书      科研工具百宝书  专利申请一本通      超全科研礼包     SCI写作学习资料   教师资格证资料大创一本通        计算机科研一本通2021热点手册       经管科研一本通 软件工具类 PS资料包                 Origin资料包   CorelDRAW资料包    Excel资料包PDF阅读&编辑器       Matlab资料包SPSS资料包             OCR识图软件Endnote资料包         SPSS amosPython资料             CitespaceLaTex                     简历模板SCI-HUB          AxMath公式编辑器CAD资料                大数据资料AI绘图资料               LINGO资料EViews资料             Proteus资料网盘本地化               NoteExpressArcGIS安装包          COMSOL资料去水印资料 科研数据类 

中国县域统计年鉴(2000-2020)  

MySQL数据库   全国地铁站点数据

中国旅游统计年鉴(2000-2019)

中国能源统计年鉴(1986-2020)

中国住户调查合集(2000-2020)

中国金融统计年鉴(1986-2019)

全球经济营商环境(2004-2020)

中国农村统计年鉴(1985-2019)

中国港口统计年鉴(2000-2019)

中国上市公司数据(1990-2020)

 英语学习类 

雅思提分资料包      考博英语资料包 论文写作类 学术海报模板        论文写作大礼包20万字免费查重     SCI资料  期刊信息汇总         SCI写作辅助神器研究计划模板 科研工具书 应用多元统计分析     数学建模基础教程




扫码添加学术顾问
回复【科研交流群】
加入【科研岛科研交流】群
海量资料抢先领!



想掌握更多本硕博升学、科研、论文一手资讯

点下方关注我们哦~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存